本文提出了一个新的语音转换(VC)任务,从人类语音到类似狗的语音,同时保留语言信息,作为人类到非人类生物语音转换(H2NH-VC)任务的一个例子。尽管大多数VC研究都涉及人类VC,但H2NH-VC旨在将人类的言论转变为非人类生物式的言语。非平行VC允许我们开发H2NH-VC,因为我们无法收集非人类生物说人类语言的并行数据集。在这项研究中,我们建议将狗用作非人类生物目标域的一个例子,并定义“像狗一样说话”任务。为了阐明“像狗一样说话”任务的可能性和特征,我们使用现有的代表性非平行VC方法进行了比较实验,以声学特征(Mel-Cepstral系数和MEL-SPECTROGINS),网络体系结构(五个不同的kernel- kernel--尺寸设置)和训练标准(基于差异自动编码器(VAE)基于对抗性网络)。最后,使用平均意见分数评估了转换后的声音:狗的声音,声音质量和可理解性以及字符错误率(CER)。该实验表明,梅尔光谱图的使用改善了转换后的语音的类似狗,而保留语言信息则具有挑战性。强调了H2NH-VC当前VC方法的挑战和局限性。
translated by 谷歌翻译
This study demonstrates the feasibility of point cloud-based proactive link quality prediction for millimeter-wave (mmWave) communications. Image-based methods to quantitatively and deterministically predict future received signal strength using machine learning from time series of depth images to mitigate the human body line-of-sight (LOS) path blockage in mmWave communications have been proposed. However, image-based methods have been limited in applicable environments because camera images may contain private information. Thus, this study demonstrates the feasibility of using point clouds obtained from light detection and ranging (LiDAR) for the mmWave link quality prediction. Point clouds represent three-dimensional (3D) spaces as a set of points and are sparser and less likely to contain sensitive information than camera images. Additionally, point clouds provide 3D position and motion information, which is necessary for understanding the radio propagation environment involving pedestrians. This study designs the mmWave link quality prediction method and conducts two experimental evaluations using different types of point clouds obtained from LiDAR and depth cameras, as well as different numerical indicators of link quality, received signal strength and throughput. Based on these experiments, our proposed method can predict future large attenuation of mmWave link quality due to LOS blockage by human bodies, therefore our point cloud-based method can be an alternative to image-based methods.
translated by 谷歌翻译
Transparency of Machine Learning models used for decision support in various industries becomes essential for ensuring their ethical use. To that end, feature attribution methods such as SHAP (SHapley Additive exPlanations) are widely used to explain the predictions of black-box machine learning models to customers and developers. However, a parallel trend has been to train machine learning models in collaboration with other data holders without accessing their data. Such models, trained over horizontally or vertically partitioned data, present a challenge for explainable AI because the explaining party may have a biased view of background data or a partial view of the feature space. As a result, explanations obtained from different participants of distributed machine learning might not be consistent with one another, undermining trust in the product. This paper presents an Explainable Data Collaboration Framework based on a model-agnostic additive feature attribution algorithm (KernelSHAP) and Data Collaboration method of privacy-preserving distributed machine learning. In particular, we present three algorithms for different scenarios of explainability in Data Collaboration and verify their consistency with experiments on open-access datasets. Our results demonstrated a significant (by at least a factor of 1.75) decrease in feature attribution discrepancies among the users of distributed machine learning.
translated by 谷歌翻译
多源数据融合,共同分析了多个数据源以获得改进的信息,引起了广泛的研究关注。对于多个医疗机构的数据集,数据机密性和跨机构沟通至关重要。在这种情况下,数据协作(DC)分析通过共享维数减少的中间表示,而无需迭代跨机构通信可能是合适的。在分析包括个人信息在内的数据时,共享数据的可识别性至关重要。在这项研究中,研究了DC分析的可识别性。结果表明,共享的中间表示很容易识别为原始数据以进行监督学习。然后,这项研究提出了一个非可读性可识别的直流分析,仅共享多个医疗数据集(包括个人信息)的非可读数据。所提出的方法基于随机样本排列,可解释的直流分析的概念以及无法重建的功能的使用来解决可识别性问题。在医学数据集的数值实验中,提出的方法表现出非可读性可识别性,同时保持了常规DC分析的高识别性能。对于医院的数据集,提出的方法在仅使用本地数据集的本地分析的识别性能方面表现出了9个百分点的改善。
translated by 谷歌翻译
游戏中的学习理论在AI社区中很突出,这是由多个不断上升的应用程序(例如多代理增强学习和生成对抗性网络)的动机。我们提出了突变驱动的乘法更新(M2WU),以在两人零和零正常形式游戏中学习平衡,并证明它在全面和嘈杂的信息反馈设置中都表现出了最后的题融合属性。在全信息反馈设置中,玩家观察了实用程序功能的确切梯度向量。另一方面,在嘈杂的信息反馈设置中,他们只能观察到嘈杂的梯度向量。现有的算法,包括众所周知的乘法权重更新(MWU)和乐观的MWU(OMWU)算法,未能收敛到具有嘈杂的信息反馈的NASH平衡。相反,在两个反馈设置中,M2WU表现出最后的近期收敛到NASH平衡附近的固定点。然后,我们证明它通过迭代地适应突变项来收敛到精确的NASH平衡。我们从经验上确认,M2WU在可剥削性和收敛速率方面胜过MWU和OMWU。
translated by 谷歌翻译
回忆疗法是基于记忆的回忆,是心理保健。但是,该方法的有效性在个体之间有所不同。为了解决这个问题,有必要提供更多个性化的支持;因此,本研究采用了基于思想理性(ACT-R)的认知体系结构自适应控制的个人记忆回忆的计算模型。反映用户状态的ACT-R内存模型有望促进个人回忆。在这项研究中,我们提出了一种通过与内存模型的重复相互作用来估算用户内部状态的方法。该模型包含用户的LIFELOG,向用户展示了一个内存项(刺激),并根据调整模型的内部参数的刺激接收用户对刺激的响应。通过重复这些过程,模型的参数将反映用户的内部状态。为了确认所提出方法的可行性,我们在使用合并该模型的系统时分析了用户的话语。结果证实了该方法从用户的话语中估算模型的内存检索参数的能力。此外,该方法估计使用系统引起的用户情绪变化的能力得到了证实。这些结果支持估计人类内部状态的交互式方法的可行性,这最终将有助于诱导记忆回忆和情绪为我们的幸福感。
translated by 谷歌翻译
对外部刺激做出反应的触觉传入,例如(RA)和Pacinian(PC)传入,可以使复杂的动作(例如抓住,抚摸和识别对象)。要深入了解这些动作引起的触觉感觉,需要揭示触觉传入的活动。为此,我们为振动刺激的每种触觉传入开发了一个计算模型,结合了有限元分析有限元方法(FEM)分析和代表神经特征的泄漏的集成和火力模型。该计算模型可以轻松估计触觉传入的神经活动,而无需测量生物学数据。使用FEM分析计算的皮肤变形被取代为集成与火力模型,作为计算每种触觉传入的膜电位的电流输入。我们使用报道的生物学数据在集成和火力模型中优化了参数。然后,我们计算了数值模型对正弦,二氢和白噪声机械刺激的响应,以验证提出的数值模型。从结果来看,计算模型很好地再现了对振动刺激的神经反应,例如正弦,二氢和噪声刺激,并与可以模拟对振动刺激的响应的相似计算模型进行了优越的比较。
translated by 谷歌翻译
在这项研究中,我们考虑了两个玩家零和游戏中的正规领导者(FTRL)动力学的变体。在时间平衡策略时,FTRL保证会融合到NASH平衡,而许多变体都遭受了极限自行车行为的问题,即缺乏最后的介质收敛保证。为此,我们提出了一种突变FTRL(M-FTRL),该算法引入了用于动作概率扰动的突变。然后,我们研究了M-FTRL的连续时间动力学,并提供了强大的收敛保证,可以向固定点提供近似于NASH平衡的固定点。此外,我们的仿真表明,M-FTRL比FTRL和乐观的FTRL在全信息反馈下享有更快的收敛速度,并且在强盗反馈下表现出明显的收敛性。
translated by 谷歌翻译
贝叶斯优化有效地优化了黑盒问题中的参数。但是,在有限的试验中,该方法对于高维参数不起作用。可以通过非线性将其嵌入低维空间来有效地探索参数。但是,不能考虑约束。我们提出了将参数分解组合到非线性嵌入中,以考虑在高维贝叶斯优化中考虑已知的平等和未知不平等约束。我们将提出的方法应用于粉末称重任务,作为使用情况。根据实验结果,与手动参数调整相比,提出的方法考虑了约束,并将试验数量减少约66%。
translated by 谷歌翻译
指导屏幕外兴趣点(POI)是一种为小屏幕设备的用户提供其他信息的实用方法,例如智能设备和头部安装的显示器。流行的先前方法涉及在屏幕上显示一个称为楔形的原始图,以供用户估算隐形顶点上的屏幕外POI。因为他们利用称为Amodal完成的认知过程,即使一部分被阻塞,用户也可以想象整个数字,因此本地化准确性也会受到偏见和个体差异的影响。为了提高准确性,我们建议使用考虑影响影响的认知成本来优化该数字。我们还设计了具有不同参数的两种优化类型:无偏的Optwedge(UOW)和偏置Optwedge(Bow)。实验结果表明,与启发式方法相比,OPTWEDGE对近距离的指导更加准确。
translated by 谷歌翻译